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摘要 : 【 目的 】 促 进 高 校 图 书馆 数字 资源 的 合理 建设 、 科 学 管理 和 高 效 利 用 。[ 应 用 背景 ] IPv6 的 推广 和 万 兆 校 
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IPv6 ”端口 镜像 


园 网 的 普及 给 网 络 数据 采集 造成 困难 。[ 方法 ] 提出 一 种 网 络 设备 端口 镜像 设计 方法 , 在 数字 资源 利用 分 析 系 统 
采集 数据 前 进行 IPv4 及 IPv6 网 络 数据 过 滤 。[ 结果 】 实 际 部 署 一 个 支持 IPv4/IPv6 双 栈 及 万 兆 网 络 的 数字 资源 
利用 分 析 系 统 。[ 结论 】 使 图 书馆 数字 资源 利用 分 析 系 统 适应 双 栈 高 速 的 校园 网 网 络 环境 。 


1 3 引 


高 校 图 书馆 数字 资源 不 仅 包括 日 常 使 用 的 文献 资 
料 , 还 包含 图 书馆 网 络 平台 中 共享 的 信息 、 软 件 、 国 
内 外 数据 库 等 网 络 学 术 资 源 。 如 何 促 进 高 校 图 书馆 数 
字 资 源 的 合理 建设 、 科 学 管理 和 高 效 利 用 ,是 当前 图 
书馆 工作 关注 探究 的 问题 之 一 ,并 已 有 较 多 关于 图 书 
馆 数 字 资 源 利用 评估 体系 的 研究 中 及 实践 探索 。 

数字 资源 利用 评估 常见 调查 手段 为 用 户 调 查 问 卷 
报告 所 以 及 数据 库 供应 商 提供 的 访问 记录 等 ,其 中 数 
字 资 源 登 录 检 索 及 下 载 的 次 数 、 用 户 群 与 用 户 比例 等 
经 由 网 络 传递 的 数据 信息 可 由 校园 网 网 络 环境 获取 ， 
据 了 解 目 前 已 有 部 分 高 校 图 书馆 部 署 了 自主 研发 或 者 
商用 的 数字 资源 利用 分 析 系 统 。 受 限于 专用 硬件 高 昂 
的 成 本 , 常见 的 数字 资源 利用 分 析 系 统 通常 以 通用 处 
理 器 实现 包头 软 解析 ， 此 类 系统 的 网 络 采集 瓶颈 为 
1GbpsDB， 并 且 一 般 未 支持 IPv6。 随 着 IPv6 在 高 校 的 
推广 以 及 万 兆 校园 网 的 普及 ,数字 资源 利用 分 析 系 统 
已 经 难以 承载 校园 网 流量 。 

本 文 致力 于 设计 一 种 支持 IPv4/IPv6 双 栈 以 及 万 


了 中 


兆 网 络 环境 的 数据 过 滤 方 法 , 该 方法 在 系统 采集 数据 
之 前 完成 数据 过 滤 , 仅 将 与 图 书馆 相关 的 IPv4IPv6 流 
量 输 出 至 数据 采集 与 分 析 功 能 模块 , 使 数字 资源 利用 
分 析 系 统 能 适应 高 速 双 栈 的 高 校 校园 网 环境 。 


2 需求 及 设计 思路 


2.1 技术 背景 

(1) IPv6 的 推广 

IPv6 是 IETF 设计 的 用 于 替代 现行 版 本 (IPv4) 的 下 
一 代 IP 协议 , 于 1994 年 在 RFC1752 中 被 定义 四。 由 
国家 发 展 和 改革 委员 会 主导 的 下 一 代 互联 网 示范 工程 
(CNGD 项 目 已 于 2010 年 完成 百 所 高 校 的 IPv6 全 面 覆 
盖 丫 。2012 年 6 月 6 日 , 全 球 范围 内 的 IPv6 网 络 正式 
启动 四 。IPv6 网 络 已 日 渐 推广 并 承载 了 部 分 数字 资源 
传输 ,但 由 于 协议 体系 结构 的 不 同 ， 网 络 管理 方面 也 
存在 很 大 差异 , 面向 IPv6 的 管理 分 析 工 具 不 完善 , IPv6 
成 为 图 书馆 数字 资源 利用 分 析 系 统 的 难题 之 一 。 

(2) 万 兆 校园 网 的 普及 

2002 年 7 月 18 日 IEEE 通 过 了 802.3ae 万 兆 以 太 
网 标准 后 , 万 兆 以 太 网 凭借 其 高 达 10Gbps 的 带宽 以 
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及 种 种 技术 优势 , 逐渐 在 高 校 校园 网 中 普及 应 用 , 同 
时 也 给 高 校 图 书馆 数字 资源 利用 分 析 系统 带 来 了 极 大 
压力 。 

网 络 数据 采集 可 分 为 基于 专用 硬件 的 网 络 数据 采 
集 和 基于 通用 处 理 器 平台 的 网 络 数据 采集 。 基 于 专用 
硬件 的 采集 方法 在 高 速 链 路 的 环境 下 有 巨大 的 性 能 优 
势 , 但 是 昂贵 的 成 本 让 大 多 数 系统 仍 选 用 基于 通用 处 
理 器 以 软件 方法 实现 包头 解析 , 受 限 于 操作 系统 和 硬 
件 性 能 ， 目 前 处 理 速 度 仅 能 达到 1Gbps(1488Kpps)D， 
万 兆 流量 链 路 已 成 为 数字 资源 利用 分 析 系 统 部 署 的 
瓶颈 。 

(3) 流 镜像 技术 

在 数据 捕获 采集 前 , 由 网 络 设备 进行 数据 输出 时 
的 过 滤 分 流 是 解决 系统 网 络 采集 瓶颈 的 有 效 手 段 。 

常见 的 数据 输出 技术 为 端口 镜像 及 分 路 器 。 分 路 
器 为 物理 层 分 接 设 备 ,不 支持 数据 过 滤 。 端 口 镜像 技 
术 是 网 络 设备 提供 的 管理 功能 , 将 指定 端口 或 VLAN 
的 报 文 复制 一 份 到 其 他 端口 1, 流 镜像 技术 (基于 ACL 
的 镜像 ) 是 端口 镜像 技术 的 一 种 ,， 仅 将 匹配 流 分 类 条 件 


图 1 镜像 流量 走向 示意 图 


本 地 镜像 将 数据 在 硬件 转发 时 进行 额外 复制 ， 发 
往 镜像 目的 端口 。 其 镜像 数据 流 走向 示意 图 如 图 1 模 
型 A 所 示 。 远 程 镜像 技术 将 镜像 报 文 发 送 至 远程 镜像 
反射 口 , 通过 镜像 反射 口 将 报 文 在 远程 镜像 VLAN 内 
通过 广播 方式 复制 发 送 , 数据 流 走向 如 模型 B 所 示 。 
流 镜像 仅 将 匹配 流 分 类 条 件 的 报 文 复制 到 指定 目的 
地 ， 如 模型 C 所 示 。 

本 文 提出 一 种 技术 设想 : 根据 流 镜像 和 多 输出 远 
程 镜像 的 技术 原理 特征 ， 如 果 能 在 交换 机 转发 平台 将 
流 镜像 的 数据 流 直接 发 往 远 程 镜像 技术 中 的 镜像 反射 
口 ,， 再 由 反射 口 将 报 文 广播 发 往 所 有 配置 为 远程 
VLAN 的 端口 , 如 图 1 中 模型 D 所 示 ， 即 将 流 镜像 与 
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的 报 文 复制 到 指定 目的 地 四, 是 目前 唯一 具有 数据 过 
滤 功 能 的 镜像 技术 。 

端口 镜像 技术 需要 消耗 交换 机 的 软 硬 件 性 能 ， 当 
前 国内 外 顶级 交换 机 的 镜像 输出 能 力也 局 限于 4 组 其 
至 少 于 2 组 镜像 组 。 流 镜像 技术 仅 在 部 分 最 新 网 络 设 
备 的 最 新 软 便 件 版 本 中 被 支持 ， 功 能 有 较 多 局 限 ， 稳 
定性 也 需 验 证 ,一 般 仅 支持 一 个 输出 马 。 流 镜像 技术 可 
支持 数字 资源 利用 分 析 系 统 的 数据 过 滤 需 求 ， 然 而 大 
多 数 校园 网 核心 设备 并 不 支持 流 镜像 技术 , 文 持 该 技 
术 的 设备 上 有 限 的 流 镜像 资源 也 往往 已 用 于 支持 用 户 
分 析 、 攻 击 防 护 、 安 全 检测 、 与 情 控制 等 网 络 安全 管 
理 系统 。 

综 上 所 述 , 流 镜像 技术 局 限 性 大 、 部 署 成 本 高 且 
仅 支 持 少 量 输出 ， 难 以 在 校园 网 核心 设备 上 部 署 该 技 
术 为 系统 提供 数据 过 滤 。 

2.2 ”复合 镜像 技术 

端口 镜像 技术 可 细 分 为 三 种 : 本 地 镜像 、 远 程 镜 

像 、 流 镜像 。 图 1 为 各 种 镜像 技术 的 镜像 流量 走向 示 
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远程 镜像 功能 深度 结合 形成 一 种 复合 镜像 技术 , 则 该 
复合 镜像 技术 可 以 在 硬件 层面 整合 实现 可 精确 控制 的 
多 路 输出 , 解决 目前 大 多 数 网 络 设备 上 镜像 过 滤 与 多 
输出 难以 并 存 的 矛盾 , 为 数字 资源 利用 分 析 系 统 提供 
数据 过 滤 支 持 。 
2.3 ”整体 技术 思路 

信息 采集 分 析 系 统一 般 分 为 数据 采集 过 滤 、 数 据 
存储 管理 、 数 据 分 析 表 示 三 个 功能 模块 由 采集 系 
统 本 身 的 数据 采集 模块 捕获 全 部 数据 后 再 进行 数据 
过 滤 。 

基于 支持 IPv4/IPv6 双 栈 以 及 万 兆 网 络 环境 数据 
过 滤 方 法 的 数字 资源 利用 分 析 系 统 在 传统 信息 采集 系 
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统 架构 的 基础 上 , 将 数据 过 滤 功 能 提前 至 数据 采集 前 
完成 , 整体 设计 为 具有 数据 过 滤 、 数 据 采集 存储 、 数 
据 分 析 表 示 三 个 功能 模块 ， 整体 模型 如 图 2 所 示 : 


数据 过 滤 数据 采集 存储 数据 分 析 表 示 
a | 区 向 癌 ]| 

' LIPv4 数 据 过 滤 | ， [| : 、! 分 析 : 
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图 2 数字 资源 利用 分 析 系 统 整 体 模型 


数据 过 滤 模 块 从 核心 网 络 获 取 一 份 同时 包含 IPv4 
及 JIPv6 数据 包 的 网 络 数 据 , 通过 复合 镜像 技术 对 数据 
进行 过 滤 分 流 后 仅 将 与 图 书馆 数字 资源 相关 的 信息 输 
出 至 可 支持 双 栈 流量 的 数据 采集 模块 ， 以 解决 现 有 数 
字 资 源 利用 分 析 系 统 无 法 承载 万 兆 双 栈 校园 网 网 络 流 
量 的 问题 。 

数据 采集 存储 模块 采集 与 数字 资源 相关 的 信息 ; 
数据 分 析 表 示 模 块 提供 数据 展示 、 查 询 及 报表 功能 ， 
与 传统 系统 功能 基本 相同 。 


3 ”实现 方案 


根据 数字 资源 利用 分 析 系 统 整 体 模型 ， 系 统 共 分 
为 三 个 模块 ， 其 中 数据 采集 存储 及 数据 分 析 表 示 模 块 
已 有 较 多 研究 成 果 和 成 熟 产 品 ， 本 文 研究 重点 为 利用 
基于 提出 的 复合 镜像 技术 的 数据 过 滤 方 法 , 在 数据 采 
集 之 前 完成 数据 过 滤 。 
3.1 具体 技术 问题 

数据 过 滤 模 块 的 实现 需 解决 以 下 技术 问题 : 

(1) 镜像 流量 的 再 次 镜像 

作为 一 种 技术 设想 , 复合 镜像 技术 不 能 直接 应 用 
于 对 稳定 性 有 高 度 需 求 的 生产 网 络 , 该 模块 需 在 独立 
于 生产 网 络 的 网 络 硬件 上 部 署 完 成 。 因 此 面临 着 该 硬 
件 能 否 识 别 从 核心 网 络 设备 取得 的 数据 源 并 进行 转发 
的 问题 。 

基于 物理 层 的 分 路 器 传输 以 及 基于 数据 链 路 层 的 
端口 镜像 等 输出 技术 都 可 用 于 从 生产 网 络 输出 。 鉴 于 
分 路 传输 在 具有 多 链 路 负载 均衡 的 校园 网 环境 中 部 署 
不 灵活 且 额 外 增加 网 络 故障 点 的 局 限 , 本 系统 选用 本 
地 镜像 方式 。 
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应 用 认 


网 络 设备 通过 匹配 数据 帧 的 目标 MAC 进行 流量 
识别 及 转发 , 镜像 技术 作为 网 络 设备 管理 功能 ， 其 报 
文 镜像 复制 会 在 网 络 设备 识别 转发 该 报 文 前 进行 , 其 
复制 技术 可 以 类 比 成 Hub5， 即 使 网 络 设 备 因 为 
VLAN Tag 之 类 的 传输 标志 不 会 转发 某 些 镜像 报 文 ， 
也 会 先 将 报 文 先 发 往 镜像 目的 端口 , 可 以 保证 全 部 报 
文 的 镜像 输出 , 实验 同时 证 明了 该 机 制 , 因 此 ,基于 输 
出 后 的 数据 报 文通 过 独立 的 网 络 设备 进行 再 次 镜像 输 
出 是 可 行 的 。 

(2) 复合 镜像 技术 具体 实现 

交换 机 设备 作为 一 个 封闭 的 功能 硬件 ， 并 不 提供 
底层 硬件 转发 的 修改 接口 , 为 在 实际 环境 中 验证 复合 
镜像 技术 的 可 行 性 , 通过 流 镜像 的 流 定义 ACL 对 网 络 
流量 进行 筛选 过 滤 , 仅 将 符合 条 件 的 流量 送 往 某 个 端 
口 , 并 对 该 端口 进行 再 次 远程 镜像 ， 实 现 可 挖 的 数据 
多 路 输出 。 该 实验 方案 与 复合 镜像 技术 的 差距 在 于 用 
额外 的 物理 接口 转发 了 复合 镜像 技术 设计 中 直接 发 往 
远程 镜像 反射 口 的 流量 。 

实验 证 明 直 接 对 流 镜像 目的 口 进 行 远程 镜像 ， 远 
程 端口 目的 端口 并 没有 预期 的 输出 。 其 原因 为 镜像 目 
的 口 被 标记 为 非 转 发 口 , 不 能 直接 对 流 镜像 目的 口 进 
行 再 次 远程 镜像 。 为 再 次 触发 镜像 功能 , 将 流 镜像 目 
的 端口 与 本 机 其 他 端口 通过 外 部 物理 线路 互联 , 将 过 
滤 后 的 流量 重新 送 回 网 络 输出 系统 , 并 对 该 回 接 端 口 
进行 远程 镜像 输出 至 多 个 端口 , 实现 多 输出 。 

(3) 对 IPv4/IPV6 双 栈 流量 的 支持 

镜像 过 滤 通 过 仅 将 匹配 流 分 类 条 件 的 数据 流 复制 
至 目的 口 实现 。 常 规 的 流 分 类 仅 支 持 IPv4 或 者 IPv6 
其 中 一 种 协议 。 支 持 双 栈 流量 过 滤 需 实现 可 以 匹配 
IPv6 流 分 类 ,并 同时 匹配 IPv4 流 分 类 。 

本 系统 已 实现 IPv4/IPv6 流 分 类 同时 匹配 ,无 法 支 
持 双 协 议 同 时 匹配 的 硬件 系统 , 也 可 通过 对 源 数据 分 
别 进行 复合 镜像 以 及 本 地 镜像 加 复合 镜像 并 将 数据 输 
出 至 同一 目的 口 的 方式 ,实现 对 双 栈 流量 的 过 滤 。 
3.2 ”部 署 方案 

图 3 为 数据 过 滤 模 块 具 体 部 署 模型 ， 主 要 基于 
一 款 中 端的 支持 流 镜像 的 数据 中 心 三 层 万 兆 交换 机 
实现 。 可 见 , 校园 网 设备 将 一 份 镜 像 数 据 发 往 数据 过 
滤 模 块 所 在 的 交换 机 ,由 该 交换 机 将 镜像 数据 进行 
IPv4/IPv6 流量 过 滤 后 输出 并 回 接 至 该 交换 机 , 并 对 回 


~ vA- 作 甘 日 车 || 
Cl INaX Iv | FE 期 | 


总 第 268 期 2016 年 第 3 期 
接口 进行 多 输出 的 远程 镜像 ， 发 往 数 据 采集 硬件 。 数 数据 采集 与 分 析 模 块 主要 基于 一 款 中 端 网 络 安全 


据 过 滤 模 块 可 为 多 个 数据 采集 系统 提供 数据 支撑 。 设备 实现 , 主要 实现 的 功能 为 数字 资源 访问 分 析 、 文 
件 过 量 下 载 告警 、 数 据 安全 监控 等 。 


4 应 用 效果 评估 


4.1 数据 过 滤 方法 实验 过 程 
4 台 三 层 交 换 机 及 两 台 PC 终 端 被 设计 用 于 实现 本 
文 提出 的 数据 过 滤 方 法 .Switch A/B/C 用 于 模拟 生产 网 
络 。Switch DD 为 一 款 中 端 三 层 万 兆 交 换 机 。 终端 A/B 分 
回 接口 反射 口 别 使 用 Wireshark 抓 取 网 络 报 文 。 
图 3 数据 过 滤 模 块 部 署 模型 实验 拓扑 结构 如 图 4 所 示 ,，Switch B 将 G0/1 端 口 的 
数据 过 渡 模 块 的 IPv4/Pv6 流 过 滤 规 则 如 表 1 所 示 。 。 型 融通 过 本 地 多 像 发 往 G020 口 G0/20 Switch 了 
EN 配置 远程 镜像 输出 至 终端 A/B 进 行 报 文 抓 取 。 


镜像 数据 


行为 源 IP 源 端口 目的 IP 目的 端口 用 途 流 控制 信息 配置 如 下 : 
ee» deny ”特殊 用 户 ny any any “过 滤 特 殊 用 户 acl number 3000 
deny any any ”特殊 用 户 ” any 数据 rule 0 permit ip destination 10.0.5.0 0.0.0.255 
天 = . Se rule 5 permit ip destination 10.0.8.0 0.0.0.255 
permit 校 图 书馆 。 any ny any 图 书馆 内 网 络 acl ipv6 number 3100 
permit any any ” 校 图 书馆 。 any 用 户 通信 数据 rule 10 permit ipv6 destination 2001: DA8: E800: 40: : /64 
a es i rule 15 permit ipv6 destination 2001: DA8: E800: 43: : /64 
permit 数据 库 资 源 any any any 校生 用 / 对 校 流 分 类 配置 如 下 : 
| 数据 库 外 数字 资源 的 
permit any any 将， any ”访问 traffic classifier mirror-2 operator or 
宽 源 if-match acl 3000 
permit 图 书馆 资源 any any any ”任意 用 户 对 校 if-match acl ipv6 3100 
Ls EY es 
permit any any any id 官 资源 Switch A 分 别 往 10.0.5.2 等 4 个 IPv4 地 址 及 2001: 
可 : < 、 
过 泪 基 他 天 天 ”DA8: E800: 40: : 2 等 4 个 IPv6 地 址 发 5 个 Ping 包 验证 。 根 
CE 据 控 制 规则 , 终端 A/B 应 同时 捕获 到 发 往 10.0.5.2、 
GO/1 G0/2 


10.0.1.2/30 10.0.2.1/30 
2001:DA8:E800:10::2/64 2001:DA8:E800:20::1/64 
Switch A Switch C 
GO/1 G1/0/3 
10.0.1.1/30 10.0.2.2/30 


2001:DA8:E800:10::1/64 2001:DA8:E800:20::1/64 


T1/0/16 
物理 转 接 图 
T1/0/15 


T1/0/44 
远程 镜像 反射 口 


终端 A 终端 B 


图 4 复合 镜像 功能 实验 拓扑 
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10.0.8.2、2001: DA8: E800: 40: : 2、2001: DA8: E800: 
43: : 2 的 报 文 。 其 他 报 文 被 流 规则 过 滤 。 


为 校园 网 IPv4/IPv6 双 栈 出 口 镜像 流量 ， 即 过 滤 前 的 网 
络 数据 ; 对 比 组 2 为 校园 网 边界 安全 设备 , 不 支持 
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实际 结果 如 表 2 所 示 。 结果 与 预期 相符 , 证 明 支 持 
双 栈 的 复合 镜像 技术 可 行 , 数据 过 滤 方 法 准确 有 效 。 
表 2 实验 预期 及 实际 结果 对 比 


IPv6, 采集 数据 源 为 校园 网 IPv4 出 口 流量 。 
表 3 网 页 访问 日 志 量 对 比 


系统 网 页 URL 关键 字 日 志 条 目 数 
目的 全 预计 报 文 实际 报 文 数量 数字 资源 CNKI 概览 页 epub.cnki.net/KNS/brief 18 390 
数量 终端 人 终端 也 采集 系统 数据 库 介绍 页 epub.cnki.net/KNS/html 691 
0 . a CNKI 概览 页 epub.cnki.net/KNS/brief 无 法 提供 
10072 0 0 0 数据 库 介绍 页 epub.cnki.net/KNS/html 684 
10.0.8.2 5 5 5 i CNKI 概览 页 epub.cnki.net/KNS/brief 18 361 
2001: DA8: E800: 40: : 2 5 5 5 | 数据 库 介绍 页 epub.cnki.net/KNS/html 698 
2001: DA8: E800: 41: :2 0 0 0 
2001: DA8: E800: 42: : 2 0 0 0 在 承载 大 流量 数据 情况 下 ,对 比 组 1 在 日 志 功 能 
2001: DA8: E800: 43: :2 5 5 Ss 


4.2 ”系统 运行 情况 

厦门 大 学 图 书馆 已 完成 支持 IPv4/IPv6 双 栈 及 万 兆 
网 络 的 数字 资源 利用 分 析 系 统 的 实验 部 署 。 

图 5 及 图 6 为 数据 过 滤 模 块 过 滤 前 后 网 络 流量 图 ， 
对 比 发 现 过 滤 后 的 数据 量 约 为 过 滤 前 的 1%-2%， 和 常见 
的 网 络 信息 采集 系统 都 可 承载 该 级 别 的 流量 。 


时 间 H:M 


SGbps 
4Gbps 
3Gbps 
2Gbps 
1Gbps 


23:14 05:14 11:14 17:14 


图 5 数据 过 滤 前 网 络 流量 图 


120Mbps 
96Mbps 
72Mbps 
48Mbps 
24Mbps 


Obps 
23:32 3:32 7:32 11:32 15:32 19:32 


图 6 数据 过 滤 后 网 络 流量 图 
表 3 为 数字 资源 利用 分 析 系 统 与 两 组 对 比 系统 在 
同一 天 内 采集 的 网 页 访问 日 志 量 。 对 比 组 为 两 款 目前 
国内 最 高 配置 的 安全 管理 设备 ,对 比 组 1 采集 数据 源 
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及 准确 率 方面 不 及 本 系统 ,对比 组 2 与 本 系统 所 采集 
的 数据 结果 接近 。 由 此 证 明 , 本 系统 中 的 数据 过 滤 模 
块 可 以 稳定 过 滤 无 关 流 量 并 完整 输出 图 书馆 所 关注 
的 数据 信息 ,数据 采集 存储 模块 足以 承载 过 滤 后 的 
数据 量 。 

数字 资源 利用 分 析 系 统 主要 功能 为 数字 资源 访 
问 分 析 、 文 件 过 量 下 载 告 警 、 数 据 安全 监控 等 。 图 7 
为 以 图 书馆 常见 数据 库 为 统计 单位 的 站 点 请 求 量 周 
报表 ; 图 8 为 数字 资源 常见 数据 格式 文件 下 载 量 周 
报表 ; 图 9 为 安全 防护 功能 中 的 病毒 检测 告警 功能 
报表 。 


网 站 分 类 访问 用 户 数 让 请 后 ， 
CNK] 2861 明 1d4.687 
ABIINFORM 3 2 1.840 
超 坚 也 1637 
Nature 昌 内 401 
ACS 好 3 398 
CEIC 有 2 1@2 
图 7 数据 库 访问 量 周 报表 

用 户 传 罚 I 具 文件 类 型 总 请 求 数 
66.249.69.31 HTTP pdf 10.327 
66 .249.69 15 HTTP pdf 10.209 
66.249.69 23 HTTP pdf 9.944 
66.249.75.224 HTTP pdf 3.285 
66.249.75.208 HTTP pdf 3.273 
66.249.75.216 HTTP pdf 3.246 
172.16.3.5 HTTP cal 809 
图 书馆 /4 网 段 /210.34.4.79 HTTP pdf 387 
图 书馆 /4 网 段 /210 34.4.79 HTTP caj 187 
图 书馆 /reader/59.77.20.122 HTTP caj 185 


图 8 数字 资源 文件 下 载 周报 表 
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Top 病毒 源 IP 事件 数 百分比 
1 183.232.212.58 238  [ 国 时 s9% 
2 2001:DA8:215:4131::17 34 |5.423% 
3 222.199.191.49 31 [4.94499 
4 115.156.188.148 24 |3.828% 
5 121.192.176.196 21 [3.3493% 
其 他 279 Ee% 


图 9 病毒 告警 报表 


4.3 系统 缺陷 

本 文 方法 主要 基于 专业 网 络 设备 完成 , 需 具 备 专 
业 网 络 知识 的 人 员 进 行 配置 维护 , 易 用 性 较 差 ; 复合 
镜像 技术 的 实现 中 采用 端口 回 接 方 式 , 具有 一 定 的 部 
署 风险 。 


5S 结 语 


本 文 提 出 复合 镜像 技术 并 成 功 验证 其 可 行 性 , 该 
技术 可 以 解决 当前 网 络 环境 中 镜像 技术 多 输出 与 流量 
过 滤 难 以 并 存 的 问题 ; 设计 一 种 数据 过 滤 方 法 , 并 成 
功 部 署 支 持 IPv4/IPv6 双 栈 及 万 兆 校 园 网 的 数字 资源 
利用 分 析 系 统 , 该 系统 部 署 成 本 低 旦 具有 较 高 的 数据 
准确 率 。 但 该 系统 仅 完 成 数字 资源 网 络 传输 的 记录 及 
基础 统计 分 析 功 能 ， 提 供 的 数据 较为 原始 , 未 来 应 与 
数字 资源 利用 评估 体系 进一步 结合 研究 ， 以 期 为 数字 
资源 评估 提供 更 为 准确 直观 的 数据 依据 。 
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Data Filtering Method for Digital Resource Usage Analysis System for 
Dual Stack and High Speed Network 


Pan Zhuhong: Xiao Dehong!” 
I(nformation and Network Center, Xiamen University, Xiamen 361005, China) 
(Library of Xiamen University, Xiamen 361005, China) 


Abstract: [Objective] This study aims to promote the creation, management and use of academic library’s digital 
resources. [Context] The development of IPv6 and 10 Gigabit Network generated difficulties in network data 
acquisition. [Methods] We proposed a port mirroring technology for network devices. Data from the IPv4 and IPv6 
networks were filtered before they were collected for the digital resource usage analysis system. [Results] We built a 
practical digital resource usage analysis system. [Conclusions| The proposed method helped academic library establish 
digital resources analysis systems for the IPv4/IPv6 dual stack and high-speed campus network environment. 


Keywords: Digital resource Information acquisition IPv6 Port mirroring 


NISO 拟 制定 用 于 跟踪 链接 来 源 的 推荐 做 法 


美国 国家 标准 组 织 (NISO) 于 近日 批准 了 一 个 新 的 项 目 : 制定 互联 信息 环境 下 跟踪 链接 来 源 的 推荐 做 法 。 一 直 以 来 , 图 书 
馆 都 在 努力 改进 读者 访问 馆藏 的 方法 ， 图 书馆 是 否 能 够 明确 知道 读者 在 获取 到 最 终 的 图 书馆 馆藏 内 容 之 前 是 从 如 何 开 始 他 / 
她 的 检索 之 旅 的 ,对 于 图 书馆 员 在 平台 价值 判断 和 资源 分 配 上 来 说 是 非常 重要 的 。 此 外 ,出 版 商 也 会 通过 Web 日 志 分 析 来 跟 
踪 其 用 户 的 来 源 。 在 很 多 情况 下 ,进行 资源 访问 时 使 用 一 个 关键 的 技术 工具 一 一 链接 解析 器 一 一 会 无 意 掩 羡 原 本 的 引文 来 
源 。NISO 的 这 个 新 项 目 将 为 业界 创造 很 多 新 的 可 能 ,允许 内 容 主 机 和 图 书馆 来 确定 链接 的 源头 , 这 项 新 举措 还 能 够 提供 有 
关 如 何 获 取 和 人 处 理 更 多 精确 统计 信息 的 指导 。 

“学 术 机 构 有 为 学 生 和 教职员 工 提 供 方便 、 安 全 和 有 隐私 控制 的 高 质量 受 许可 资源 的 使 命 ,而 图 书馆 和 内 容 供应 商 又 有 
收集 有 关 这 些 资 源 被 利用 情况 的 需求 ,本 项 目 将 为 这 二 者 之 间 搭 建 起 一 座 桥梁 。 ”项目 倡议 者 之 一 EBSCO 信息 服务 集团 高 级 
副 总 裁 Scott Bernier 解释 :“ 虽 然 描述 内 容 使 用 程度 的 统计 数据 一 般 来 说 都 是 可 获取 的 , 但 是 , 本 项 目 将 提供 一 种 方法 ， 能 够 
获取 到 这 些 使 用 如 何 发 生 。 对 每 个 访问 请 求 有 了 精确 的 、 持 续 的 观察 , 图 书馆 就 能 拥有 更 多 的 决策 支持 信息 ， 内 容 提供 商 也 
能 获得 更 多 有 关 其 资源 的 曝光 率 及 使 用 情况 的 信息 。 这 些 数据 无 颖 会 产生 一 定 的 影响 ,全 面 提升 图 书馆 服务 的 价值 。” 

(编译 自 : http://www.niso.org/news/pr/view?item key=c2ab810f6ee30db6113af9bd6638748d5caf94f7) 


(本 刊 讯 ) 
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